Giới Thiệu

Đây là gói dữ liệu khảo sát hơn 20000 hộ dân thành phố HCMC. Dữ liệu được khảo sát trong giai đoạn lập dự án khả thi xây dựng hệ thống Metro cho thành phố hồ chí minh.

Xem phần đầu của dữ liệu

library(readxl)# gói phụ kiện để đọc dữ liệu từ bảng tính excel
library(DT)
df=data.frame(read_excel("dieutra-hogiadinh-hcm.xlsx",sheet="ketquadieutra",skip = 0)) # 
p<-datatable(head(df),rownames = FALSE,extensions = c('FixedColumns'),
             options = list(pageLength = 10,
            columnDefs = list(list(className = 'dt-left'))
            ,autoWidth = TRUE,scrollX = TRUE,fixedColumns = TRUE)
             )
p

Xem phần đuôi của dữ liệu

datatable(tail(df),rownames = FALSE,extensions = c('FixedColumns'),
             options = list(pageLength = 10,
            columnDefs = list(list(className = 'dt-left'))
            ,autoWidth = TRUE,scrollX = TRUE,fixedColumns = TRUE)
             )

Xem cấu trúc của dữ liệu

str(head(df))
## 'data.frame':    6 obs. of  229 variables:
##  $ X1  : chr  "Q1a" "1" "2" "3" ...
##  $ X2  : chr  "Q1b" "34" "34" "369" ...
##  $ X3  : chr  "Q1c" "47" "94" "801" ...
##  $ X4  : chr  "Q1d" "47" "94" "801" ...
##  $ X5  : chr  "Q1e" "29" "29" "367" ...
##  $ X6  : chr  "Q1f1" "13" "13" "17" ...
##  $ X7  : chr  "Q1f2" "1" "1" "2" ...
##  $ X8  : chr  "Q1g1" "10" "10" "15" ...
##  $ X9  : chr  "Q1g2" "1" "1" "2" ...
##  $ X10 : chr  "Q2" "2" "2" "2" ...
##  $ X11 : chr  "Q3" "B<U+1EA1>ch Minh H<U+1EA3>i" "Ðào Ð<U+1EE9>c Hoàng" "nguy<U+1EC5>n van t<U+1ED1>t" ...
##  $ X12 : chr  "Q4" "202" "202" "67" ...
##  $ X13 : chr  "Q5" "1" "1" "1" ...
##  $ X14 : chr  "Q6a" "1" "1" "1" ...
##  $ X15 : chr  "Q6b" "1674385916" "837222457" "838597075" ...
##  $ X16 : chr  "Q7" "1" "1" "1" ...
##  $ X17 : chr  "Q8a" "1" "2" "1" ...
##  $ X18 : chr  "Q8b" "2" "3" "3" ...
##  $ X19 : chr  "Q8c" "2" "2" "1" ...
##  $ X20 : chr  "Q8d" "2" "2" "1" ...
##  $ X21 : chr  "Q8e" "3" "3" "1" ...
##  $ X22 : chr  "Q9" NA "2500000" NA ...
##  $ X23 : chr  "Q10" "25" "7" "62" ...
##  $ X24 : chr  "Q11" "202" "298" NA ...
##  $ X25 : chr  "Q12a" "1" "1" "1" ...
##  $ X26 : chr  "Q12b" "1" "1" "1" ...
##  $ X27 : chr  "Q12c" "2" "2" "2" ...
##  $ X28 : chr  "Q12d" "1" "1" "2" ...
##  $ X29 : chr  "Q12e" "2" "1" "1" ...
##  $ X30 : chr  "Q12f" "2" "1" "1" ...
##  $ X31 : chr  "Q13a" "3" "4" "3" ...
##  $ X32 : chr  "Q13b" "0" "0" "0" ...
##  $ X33 : chr  "Q13c" "0" "0" "0" ...
##  $ X34 : chr  "Q13d" "0" "0" "0" ...
##  $ X35 : chr  "Q13e" "0" "0" "0" ...
##  $ X36 : chr  "Q13f" "0" "0" "1" ...
##  $ X37 : chr  "Q13g" "0" "0" "0" ...
##  $ X38 : chr  "Q13h" "0" "0" "0" ...
##  $ X39 : chr  "Q13i" "0" "0" "0" ...
##  $ X40 : chr  "Q13j" "0" "0" "0" ...
##  $ X41 : chr  "Q13k" "3" "4" "3" ...
##  $ X42 : chr  "Q13l" "3" "3" "3" ...
##  $ X43 : chr  "Q13m" "0" "0" "0" ...
##  $ X44 : chr  "Q14" "9" "10" "9" ...
##  $ X45 : chr  "Q15" "2" "3" "3" ...
##  $ X46 : chr  "Q16" "1" "2" "1" ...
##  $ X47 : chr  "Q17" "1" "1" "1" ...
##  $ X48 : chr  "Q18a1" "6" "6" "6" ...
##  $ X49 : chr  "Q18b1" "5" "10" "3" ...
##  $ X50 : chr  "Q18c1" "1" "1" "1" ...
##  $ X51 : chr  "Q18d1" "1" "1" "1" ...
##  $ X52 : chr  "Q18a2" "1" "6" "6" ...
##  $ X53 : chr  "Q18b2" "2" "10" "2" ...
##  $ X54 : chr  "Q18c2" "1" "1" "1" ...
##  $ X55 : chr  "Q18d2" "2" "1" "1" ...
##  $ X56 : chr  "Q18a3" NA "8" NA ...
##  $ X57 : chr  "Q18b3" NA "10" NA ...
##  $ X58 : chr  "Q18c3" NA "1" NA ...
##  $ X59 : chr  "Q18d3" NA "1" NA ...
##  $ X60 : chr  "Q18a4" NA NA NA ...
##  $ X61 : chr  "Q18b4" NA NA NA ...
##  $ X62 : chr  "Q18c4" NA NA NA ...
##  $ X63 : chr  "Q18d4" NA NA NA ...
##  $ X64 : chr  "Q18a5" NA NA NA ...
##  $ X65 : chr  "Q18b5" NA NA NA ...
##  $ X66 : chr  "Q18c5" NA NA NA ...
##  $ X67 : chr  "Q18d5" NA NA NA ...
##  $ X68 : chr  "Q18a6" NA NA NA ...
##  $ X69 : chr  "Q18b6" NA NA NA ...
##  $ X70 : chr  "Q18c6" NA NA NA ...
##  $ X71 : chr  "Q18d6" NA NA NA ...
##  $ X72 : chr  "Q18a7" NA NA NA ...
##  $ X73 : chr  "Q18b7" NA NA NA ...
##  $ X74 : chr  "Q18c7" NA NA NA ...
##  $ X75 : chr  "Q18d7" NA NA NA ...
##  $ X76 : chr  "Q18a8" NA NA NA ...
##  $ X77 : chr  "Q18b8" NA NA NA ...
##  $ X78 : chr  "Q18c8" NA NA NA ...
##  $ X79 : chr  "Q18d8" NA NA NA ...
##  $ X80 : chr  "Q18a9" NA NA NA ...
##  $ X81 : chr  "Q18b9" NA NA NA ...
##  $ X82 : chr  "Q18c9" NA NA NA ...
##  $ X83 : chr  "Q18d9" NA NA NA ...
##  $ X84 : chr  "Q18a10" NA NA NA ...
##  $ X85 : chr  "Q18b10" NA NA NA ...
##  $ X86 : chr  "Q18c10" NA NA NA ...
##  $ X87 : chr  "Q18d10" NA NA NA ...
##  $ X88 : chr  "Q19" "300000" "1000000" "900000" ...
##  $ X89 : chr  "Q43" "5" "2" "5" ...
##  $ X90 : chr  "Q44a" "2" "2" "1" ...
##  $ X91 : chr  "Q44b" "202" "298" NA ...
##  $ X92 : chr  "Q45" "1" "1" "1" ...
##  $ X93 : chr  "Q46" "5" "2" "5" ...
##  $ X94 : chr  "Q53" "2" "1" "2" ...
##  $ X95 : chr  "Q54" "2" "2" "2" ...
##  $ X96 : chr  "Q55" NA "1" NA ...
##  $ X97 : chr  "Q56" NA "3" NA ...
##  $ X98 : chr  "Q57" NA "3" NA ...
##  $ X99 : chr  "Q58" NA "3" NA ...
##   [list output truncated]
library(dplyr)
glimpse(head(df))
## Rows: 6
## Columns: 229
## $ X1   <chr> "Q1a", "1", "2", "3", "4", "5"
## $ X2   <chr> "Q1b", "34", "34", "369", "377", "371"
## $ X3   <chr> "Q1c", "47", "94", "801", "801", "801"
## $ X4   <chr> "Q1d", "47", "94", "801", "801", "801"
## $ X5   <chr> "Q1e", "29", "29", "367", "367", "367"
## $ X6   <chr> "Q1f1", "13", "13", "17", "25", "26"
## $ X7   <chr> "Q1f2", "1", "1", "2", "2", "2"
## $ X8   <chr> "Q1g1", "10", "10", "15", "24", "25"
## $ X9   <chr> "Q1g2", "1", "1", "2", "2", "2"
## $ X10  <chr> "Q2", "2", "2", "2", "2", "2"
## $ X11  <chr> "Q3", "B<U+1EA1>ch Minh H<U+1EA3>i", "Ðào Ð<U+1EE9>c Hoàng", "nguy<U+1EC5>n van t<U+1ED1>t", "lê min~
## $ X12  <chr> "Q4", "202", "202", "67", "67", "67"
## $ X13  <chr> "Q5", "1", "1", "1", "1", "1"
## $ X14  <chr> "Q6a", "1", "1", "1", "1", "1"
## $ X15  <chr> "Q6b", "1674385916", "837222457", "838597075", "908739072", "9370~
## $ X16  <chr> "Q7", "1", "1", "1", "1", "1"
## $ X17  <chr> "Q8a", "1", "2", "1", "1", "2"
## $ X18  <chr> "Q8b", "2", "3", "3", "2", "2"
## $ X19  <chr> "Q8c", "2", "2", "1", "1", "1"
## $ X20  <chr> "Q8d", "2", "2", "1", "2", "2"
## $ X21  <chr> "Q8e", "3", "3", "1", "1", "1"
## $ X22  <chr> "Q9", NA, "2500000", NA, NA, "1800000"
## $ X23  <chr> "Q10", "25", "7", "62", "75", "1"
## $ X24  <chr> "Q11", "202", "298", NA, NA, "73"
## $ X25  <chr> "Q12a", "1", "1", "1", "1", "1"
## $ X26  <chr> "Q12b", "1", "1", "1", "1", "1"
## $ X27  <chr> "Q12c", "2", "2", "2", "2", "1"
## $ X28  <chr> "Q12d", "1", "1", "2", "1", "2"
## $ X29  <chr> "Q12e", "2", "1", "1", "2", "2"
## $ X30  <chr> "Q12f", "2", "1", "1", "2", "1"
## $ X31  <chr> "Q13a", "3", "4", "3", "4", "4"
## $ X32  <chr> "Q13b", "0", "0", "0", "0", "0"
## $ X33  <chr> "Q13c", "0", "0", "0", "0", "0"
## $ X34  <chr> "Q13d", "0", "0", "0", "0", "0"
## $ X35  <chr> "Q13e", "0", "0", "0", "0", "0"
## $ X36  <chr> "Q13f", "0", "0", "1", "0", "0"
## $ X37  <chr> "Q13g", "0", "0", "0", "0", "0"
## $ X38  <chr> "Q13h", "0", "0", "0", "0", "0"
## $ X39  <chr> "Q13i", "0", "0", "0", "0", "0"
## $ X40  <chr> "Q13j", "0", "0", "0", "0", "0"
## $ X41  <chr> "Q13k", "3", "4", "3", "4", "4"
## $ X42  <chr> "Q13l", "3", "3", "3", "4", "4"
## $ X43  <chr> "Q13m", "0", "0", "0", "0", "0"
## $ X44  <chr> "Q14", "9", "10", "9", "11", "8"
## $ X45  <chr> "Q15", "2", "3", "3", "2", "3"
## $ X46  <chr> "Q16", "1", "2", "1", "1", "2"
## $ X47  <chr> "Q17", "1", "1", "1", "1", "1"
## $ X48  <chr> "Q18a1", "6", "6", "6", "6", "6"
## $ X49  <chr> "Q18b1", "5", "10", "3", "6", "3"
## $ X50  <chr> "Q18c1", "1", "1", "1", "1", "1"
## $ X51  <chr> "Q18d1", "1", "1", "1", "1", "1"
## $ X52  <chr> "Q18a2", "1", "6", "6", "6", "6"
## $ X53  <chr> "Q18b2", "2", "10", "2", "5", "2"
## $ X54  <chr> "Q18c2", "1", "1", "1", "1", "1"
## $ X55  <chr> "Q18d2", "2", "1", "1", "1", "1"
## $ X56  <chr> "Q18a3", NA, "8", NA, "6", "6"
## $ X57  <chr> "Q18b3", NA, "10", NA, "2", "2"
## $ X58  <chr> "Q18c3", NA, "1", NA, "1", "1"
## $ X59  <chr> "Q18d3", NA, "1", NA, "1", "1"
## $ X60  <chr> "Q18a4", NA, NA, NA, NA, "1"
## $ X61  <chr> "Q18b4", NA, NA, NA, NA, "1"
## $ X62  <chr> "Q18c4", NA, NA, NA, NA, "1"
## $ X63  <chr> "Q18d4", NA, NA, NA, NA, "2"
## $ X64  <chr> "Q18a5", NA, NA, NA, NA, NA
## $ X65  <chr> "Q18b5", NA, NA, NA, NA, NA
## $ X66  <chr> "Q18c5", NA, NA, NA, NA, NA
## $ X67  <chr> "Q18d5", NA, NA, NA, NA, NA
## $ X68  <chr> "Q18a6", NA, NA, NA, NA, NA
## $ X69  <chr> "Q18b6", NA, NA, NA, NA, NA
## $ X70  <chr> "Q18c6", NA, NA, NA, NA, NA
## $ X71  <chr> "Q18d6", NA, NA, NA, NA, NA
## $ X72  <chr> "Q18a7", NA, NA, NA, NA, NA
## $ X73  <chr> "Q18b7", NA, NA, NA, NA, NA
## $ X74  <chr> "Q18c7", NA, NA, NA, NA, NA
## $ X75  <chr> "Q18d7", NA, NA, NA, NA, NA
## $ X76  <chr> "Q18a8", NA, NA, NA, NA, NA
## $ X77  <chr> "Q18b8", NA, NA, NA, NA, NA
## $ X78  <chr> "Q18c8", NA, NA, NA, NA, NA
## $ X79  <chr> "Q18d8", NA, NA, NA, NA, NA
## $ X80  <chr> "Q18a9", NA, NA, NA, NA, NA
## $ X81  <chr> "Q18b9", NA, NA, NA, NA, NA
## $ X82  <chr> "Q18c9", NA, NA, NA, NA, NA
## $ X83  <chr> "Q18d9", NA, NA, NA, NA, NA
## $ X84  <chr> "Q18a10", NA, NA, NA, NA, NA
## $ X85  <chr> "Q18b10", NA, NA, NA, NA, NA
## $ X86  <chr> "Q18c10", NA, NA, NA, NA, NA
## $ X87  <chr> "Q18d10", NA, NA, NA, NA, NA
## $ X88  <chr> "Q19", "300000", "1000000", "900000", "1800000", "1200000"
## $ X89  <chr> "Q43", "5", "2", "5", "5", "1"
## $ X90  <chr> "Q44a", "2", "2", "1", "1", "2"
## $ X91  <chr> "Q44b", "202", "298", NA, NA, "73"
## $ X92  <chr> "Q45", "1", "1", "1", "6", "5"
## $ X93  <chr> "Q46", "5", "2", "5", "3", "5"
## $ X94  <chr> "Q53", "2", "1", "2", "2", "1"
## $ X95  <chr> "Q54", "2", "2", "2", "2", "2"
## $ X96  <chr> "Q55", NA, "1", NA, NA, "2"
## $ X97  <chr> "Q56", NA, "3", NA, NA, "3"
## $ X98  <chr> "Q57", NA, "3", NA, NA, "2"
## $ X99  <chr> "Q58", NA, "3", NA, NA, "2"
## $ X100 <chr> "Q59", NA, "2", NA, NA, "2"
## $ X101 <chr> "Q60", NA, "1", NA, NA, "1"
## $ X102 <chr> "Q61", "1", "3", "2", "2", "2"
## $ X103 <chr> "Q62a1", "3", "2", "3", "3", "3"
## $ X104 <chr> "Q62a2", "2", "2", "2", "2", "2"
## $ X105 <chr> "Q62a3", "3", "3", "3", "3", "2"
## $ X106 <chr> "Q62a4", "2", "1", "2", "2", "3"
## $ X107 <chr> "Q62a5", "1", "2", "2", "2", "2"
## $ X108 <chr> "Q62b1", "2", "1", "2", "2", "2"
## $ X109 <chr> "Q62b2", "2", "1", "3", "1", "1"
## $ X110 <chr> "Q62b3", "2", "2", "2", "1", "2"
## $ X111 <chr> "Q62b4", "2", "2", "2", "2", "1"
## $ X112 <chr> "Q62b5", "2", "2", "3", "2", "1"
## $ X113 <chr> "Q62c", "3", "1", "4", "3", "3"
## $ X114 <chr> "Q63a1", "3", "3", "1", "2", "3"
## $ X115 <chr> "Q63b1", "2", "3", "1", "3", "2"
## $ X116 <chr> "Q63c1", "2", "2", "2", "3", "3"
## $ X117 <chr> "Q63a2", "2", "2", "2", "3", "3"
## $ X118 <chr> "Q63b2", "2", "3", "2", "2", "3"
## $ X119 <chr> "Q63c2", "2", "3", "2", "3", "2"
## $ X120 <chr> "Q63a3", "3", "3", "1", "1", "2"
## $ X121 <chr> "Q63b3", "2", "3", "2", "2", "1"
## $ X122 <chr> "Q63c3", "2", "3", "2", "2", "2"
## $ X123 <chr> "Q63a4", "3", "3", "1", "2", "2"
## $ X124 <chr> "Q63b4", "2", "3", "2", "1", "2"
## $ X125 <chr> "Q63c4", "2", "3", "2", "2", "1"
## $ X126 <chr> "Q64", "5", "3", "4", "4", "4"
## $ X127 <chr> "Q65", "3", NA, NA, NA, NA
## $ X128 <chr> "Q66_1", "3", "3", "3", "4", "5"
## $ X129 <chr> "Q66_2", "2", "3", "3", "4", "4"
## $ X130 <chr> "Q66_3", "2", "4", "6", "4", "3"
## $ X131 <chr> "Q66_4", "2", "2", "6", "2", "3"
## $ X132 <chr> "Q66_5", "3", "3", "2", "2", "4"
## $ X133 <chr> "Q66_6", "3", "3", "6", "2", "5"
## $ X134 <chr> "Q66_7", "2", "2", "2", "2", "5"
## $ X135 <chr> "Q66_8", "3", "2", "6", "3", "5"
## $ X136 <chr> "Q66_9", "3", "3", "2", "3", "2"
## $ X137 <chr> "Q66_10", "3", "3", "3", "5", "2"
## $ X138 <chr> "Q66_11", "3", "4", "3", "6", "3"
## $ X139 <chr> "Q66_12", "4", "4", "6", "6", "3"
## $ X140 <chr> "Q66_13", "2", "2", "6", "6", "3"
## $ X141 <chr> "Q66a", "1", "13", "1", "1", "4"
## $ X142 <chr> "Q66b", "2", "8", "2", "4", "7"
## $ X143 <chr> "Q66c", "4", "4", "7", "6", "9"
## $ X144 <chr> "Q67a_1", "2", "1", "1", "1", "2"
## $ X145 <chr> "Q67a_2", "6", "3", "2", "8", "8"
## $ X146 <chr> "Q67a_3", "5", "7", "6", "5", "4"
## $ X147 <chr> "Q67b_1", "4", "4", "4", "7", "6"
## $ X148 <chr> "Q67b_2", "1", "5", "5", "6", "1"
## $ X149 <chr> "Q67b_3", "7", "6", "7", "3", "7"
## $ X150 <chr> "Q67c_1", "4", "7", "4", "4", "7"
## $ X151 <chr> "Q67c_2", "8", "2", "5", "5", "3"
## $ X152 <chr> "Q67c_3", "6", "5", "7", "2", "2"
## $ X153 <chr> "Q68a_1", "1", "3", "11", "2", "1"
## $ X154 <chr> "Q68a_2", "3", "2", "12", "10", "9"
## $ X155 <chr> "Q68a_3", "5", "5", "8", "5", "5"
## $ X156 <chr> "Q68a_4", "6", "1", "5", "1", "10"
## $ X157 <chr> "Q68a_5", "11", "10", "16", "8", "11"
## $ X158 <chr> "Q68b_1", "13", "7", "7", "13", "8"
## $ X159 <chr> "Q68b_2", "14", "8", "9", "4", "2"
## $ X160 <chr> "Q68b_3", "15", "9", "4", "9", "12"
## $ X161 <chr> "Q68b_4", "16", "16", "13", "7", "3"
## $ X162 <chr> "Q68b_5", "4", "12", "14", "3", "7"
## $ X163 <chr> "Q68c_1", "8", "5", "7", "16", "4"
## $ X164 <chr> "Q68c_2", "9", "9", "13", "6", "13"
## $ X165 <chr> "Q68c_3", "7", "13", "14", "12", "6"
## $ X166 <chr> "Q68c_4", "13", "6", "4", "15", "14"
## $ X167 <chr> "Q68c_5", "16", "15", "3", "8", "7"
## $ X168 <chr> "Q69a_1", "3", "4", "3", "5", "5"
## $ X169 <chr> "Q69a_2", "2", "2", "3", "3", "4"
## $ X170 <chr> "Q69a_3", "2", "2", "2", "3", "3"
## $ X171 <chr> "Q69a_4", "4", "3", "3", "2", "3"
## $ X172 <chr> "Q69a_5", "3", "3", "4", "3", "3"
## $ X173 <chr> "Q69a_6", "2", "4", "3", "6", "5"
## $ X174 <chr> "Q69a_7", "2", "4", "3", "5", "5"
## $ X175 <chr> "Q69a_8", "1", "1", "4", "5", "5"
## $ X176 <chr> "Q69a_9", "1", "1", "2", "5", "4"
## $ X177 <chr> "Q69a_10", "2", "1", "3", "4", "4"
## $ X178 <chr> "Q69b_1", "3", "8", "2", "2", "3"
## $ X179 <chr> "Q69b_2", "8", "9", "8", "6", "5"
## $ X180 <chr> "Q69b_3", "9", "3", "10", "8", "8"
## $ X181 <chr> "Q70", "2", "2", "2", "1", "1"
## $ X182 <chr> "Q71a_1", "1", "1", "1", "1", "1"
## $ X183 <chr> "Q71a_2", "1", "1", "1", "1", "2"
## $ X184 <chr> "Q71a_3", "2", "2", "1", "1", "2"
## $ X185 <chr> "Q71a_4", "1", "2", "2", "2", "2"
## $ X186 <chr> "Q71a_5", "1", "2", "1", "2", "1"
## $ X187 <chr> "Q71a_6", "1", "1", "1", "2", "1"
## $ X188 <chr> "Q71a_7", "1", "1", "2", "3", "2"
## $ X189 <chr> "Q71a_8", "1", "1", "1", "3", "1"
## $ X190 <chr> "Q71a_9", "1", "1", "1", "3", "3"
## $ X191 <chr> "Q71a_10", "1", "3", "1", "2", "1"
## $ X192 <chr> "Q71a_11", "1", "3", "1", "2", "1"
## $ X193 <chr> "Q71a_12", "1", "3", "2", "2", "3"
## $ X194 <chr> "Q71a_13", "2", "3", "2", "1", "2"
## $ X195 <chr> "Q71a_14", "1", "1", "2", "1", "1"
## $ X196 <chr> "Q71a_15", "1", "1", "1", "1", "1"
## $ X197 <chr> "Q71a_16", "1", "1", "2", "2", "2"
## $ X198 <chr> "Q71a_17", "1", "1", "1", "2", "3"
## $ X199 <chr> "Q71a_18", "1", "2", "1", "2", "3"
## $ X200 <chr> "Q71b_1", "2", "8", "1", "1", "3"
## $ X201 <chr> "Q71b_2", "15", "7", "6", "2", "8"
## $ X202 <chr> "Q72", "1", "1", "1", "2", "2"
## $ X203 <chr> "Q73a", "2", "3", "1", "6", "6"
## $ X204 <chr> "Q73b", "3", "4", "2", "5", "5"
## $ X205 <chr> "Q73c", "1", "1", "5", "7", "2"
## $ X206 <chr> "Q73d", "6", "2", "3", "2", "1"
## $ X207 <chr> "Q73e", "4", "7", "4", "1", "7"
## $ X208 <chr> "Q73f", "5", "6", "6", "3", "3"
## $ X209 <chr> "Q73g", "7", "5", "7", "4", "4"
## $ X210 <chr> "A74a_1", "4", "5", "3", "5", "5"
## $ X211 <chr> "A74a_2", "5", "5", "3", "6", "5"
## $ X212 <chr> "A74a_3", "5", "5", "4", "3", "3"
## $ X213 <chr> "A74a_4", "5", "5", "3", "2", "3"
## $ X214 <chr> "A74a_5", "5", "5", "2", "2", "4"
## $ X215 <chr> "A74a_6", "5", "5", "3", "4", "5"
## $ X216 <chr> "A74a_7", "5", "5", "3", "5", "4"
## $ X217 <chr> "A74a_8", "5", "5", "4", "4", "3"
## $ X218 <chr> "A74a_9", "5", "5", "4", "4", "5"
## $ X219 <chr> "A74a_10", "5", "5", "3", "4", "5"
## $ X220 <chr> "A74a_11", "5", "5", "3", "3", "3"
## $ X221 <chr> "A74a_12", "5", "5", "2", "3", "3"
## $ X222 <chr> "A74a_13", "5", "5", "3", "3", "4"
## $ X223 <chr> "A74a_14", "3", "4", "3", "4", "6"
## $ X224 <chr> "A74a_15", "3", "4", "3", "4", "4"
## $ X225 <chr> "A74a_16", "5", "4", "4", "6", "3"
## $ X226 <chr> "A74a_17", "5", "3", "3", "5", "4"
## $ X227 <chr> "A74a_18", "4", "3", "3", "3", "4"
## $ X228 <chr> "A74a_19", "2", "3", "3", "3", "6"
## $ X229 <chr> "A74a_20", "2", "2", "3", "3", "6"

File gốc

source("dieutra-hogiadinh-hcm.r")

Tả phải chuyển đổi dạng dữ liệu của từng biến

Xem lại dữ liệu xem có sự thay đổi gì không?

glimpse(head(df))
## Rows: 6
## Columns: 229
## $ Q1a     <int> 1, 2, 3, 4, 5, 6
## $ Q1b     <fct> 34, 34, 369, 377, 371, 33
## $ Q1c     <fct> 47, 94, 801, 801, 801, 94
## $ Q1d     <fct> 47, 94, 801, 801, 801, 94
## $ Q1e     <fct> 29, 29, 367, 367, 367, 29
## $ Q1f1    <fct> 13, 13, 17, 25, 26, 15
## $ Q1f2    <fct> 1, 1, 2, 2, 2, 1
## $ Q1g1    <fct> 10, 10, 15, 24, 25, 14
## $ Q1g2    <fct> 1, 1, 2, 2, 2, 1
## $ Q2      <fct> 2, 2, 2, 2, 2, 2
## $ Q3      <chr> "B<U+1EA1>ch Minh H<U+1EA3>i", "Ðào Ð<U+1EE9>c Hoàng", "nguy<U+1EC5>n van t<U+1ED1>t", "lê minh t~
## $ Q4      <chr> "202", "202", "67", "67", "67", "202"
## $ Q5      <fct> 1, 1, 1, 1, 1, 1
## $ Q6a     <fct> 1, 1, 1, 1, 1, 1
## $ Q6b     <chr> "1674385916", "837222457", "838597075", "908739072", "93701527~
## $ Q7      <fct> 1, 1, 1, 1, 1, 1
## $ Q8a     <fct> 1, 2, 1, 1, 2, 1
## $ Q8b     <fct> 2, 3, 3, 2, 2, 3
## $ Q8c     <fct> 2, 2, 1, 1, 1, 1
## $ Q8d     <fct> 2, 2, 1, 2, 2, 1
## $ Q8e     <fct> 3, 3, 1, 1, 1, 1
## $ Q9      <dbl> NA, 2500000, NA, NA, 1800000, NA
## $ Q10     <dbl> 25, 7, 62, 75, 1, 40
## $ Q11     <chr> "202", "298", NA, NA, "73", NA
## $ Q12a    <fct> 1, 1, 1, 1, 1, 1
## $ Q12b    <fct> 1, 1, 1, 1, 1, 2
## $ Q12c    <fct> 2, 2, 2, 2, 1, 2
## $ Q12d    <fct> 1, 1, 2, 1, 2, 2
## $ Q12e    <fct> 2, 1, 1, 2, 2, 2
## $ Q12f    <fct> 2, 1, 1, 2, 1, 2
## $ Q13a    <dbl> 3, 4, 3, 4, 4, 2
## $ Q13b    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13c    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13d    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13e    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13f    <dbl> 0, 0, 1, 0, 0, 0
## $ Q13g    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13h    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13i    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13j    <dbl> 0, 0, 0, 0, 0, 0
## $ Q13k    <dbl> 3, 4, 3, 4, 4, 2
## $ Q13l    <dbl> 3, 3, 3, 4, 4, 2
## $ Q13m    <dbl> 0, 0, 0, 0, 0, 1
## $ Q14     <fct> 9, 10, 9, 11, 8, 8
## $ Q15     <dbl> 2, 3, 3, 2, 3, 1
## $ Q16     <fct> 1, 2, 1, 1, 2, 1
## $ Q17     <dbl> 1, 1, 1, 1, 1, 1
## $ Q18a1   <dbl> 6, 6, 6, 6, 6, 6
## $ Q18b1   <dbl> 5, 10, 3, 6, 3, 7
## $ Q18c1   <fct> 1, 1, 1, 1, 1, 1
## $ Q18d1   <fct> 1, 1, 1, 1, 1, 1
## $ Q18a2   <dbl> 1, 6, 6, 6, 6, 6
## $ Q18b2   <dbl> 2, 10, 2, 5, 2, 5
## $ Q18c2   <fct> 1, 1, 1, 1, 1, 1
## $ Q18d2   <fct> 2, 1, 1, 1, 1, 1
## $ Q18a3   <dbl> NA, 8, NA, 6, 6, NA
## $ Q18b3   <dbl> NA, 10, NA, 2, 2, NA
## $ Q18c3   <fct> NA, 1, NA, 1, 1, NA
## $ Q18d3   <fct> NA, 1, NA, 1, 1, NA
## $ Q18a4   <dbl> NA, NA, NA, NA, 1, NA
## $ Q18b4   <dbl> NA, NA, NA, NA, 1, NA
## $ Q18c4   <fct> NA, NA, NA, NA, 1, NA
## $ Q18d4   <fct> NA, NA, NA, NA, 2, NA
## $ Q18a5   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b5   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c5   <fct> NA, NA, NA, NA, NA, NA
## $ Q18d5   <fct> NA, NA, NA, NA, NA, NA
## $ Q18a6   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b6   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c6   <fct> NA, NA, NA, NA, NA, NA
## $ Q18d6   <fct> NA, NA, NA, NA, NA, NA
## $ Q18a7   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b7   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c7   <fct> NA, NA, NA, NA, NA, NA
## $ Q18d7   <fct> NA, NA, NA, NA, NA, NA
## $ Q18a8   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b8   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c8   <fct> NA, NA, NA, NA, NA, NA
## $ Q18d8   <fct> NA, NA, NA, NA, NA, NA
## $ Q18a9   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b9   <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c9   <fct> NA, NA, NA, NA, NA, NA
## $ Q18d9   <fct> NA, NA, NA, NA, NA, NA
## $ Q18a10  <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b10  <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c10  <fct> NA, NA, NA, NA, NA, NA
## $ Q18d10  <fct> NA, NA, NA, NA, NA, NA
## $ Q19     <dbl> 300000, 1000000, 900000, 1800000, 1200000, 1000000
## $ Q43     <fct> 5, 2, 5, 5, 1, 5
## $ Q44a    <fct> 2, 2, 1, 1, 2, 1
## $ Q44b    <chr> "202", "298", NA, NA, "73", NA
## $ Q45     <fct> 1, 1, 1, 6, 5, 2
## $ Q46     <fct> 5, 2, 5, 3, 5, 1
## $ Q53     <fct> 2, 1, 2, 2, 1, 1
## $ Q54     <fct> 2, 2, 2, 2, 2, 2
## $ Q55     <fct> NA, 1, NA, NA, 2, 2
## $ Q56     <fct> NA, 3, NA, NA, 3, 3
## $ Q57     <fct> NA, 3, NA, NA, 2, 3
## $ Q58     <fct> NA, 3, NA, NA, 2, 3
## $ Q59     <fct> NA, 2, NA, NA, 2, 3
## $ Q60     <fct> NA, 1, NA, NA, 1, 1
## $ Q61     <fct> 1, 3, 2, 2, 2, 2
## $ Q62a1   <fct> 3, 2, 3, 3, 3, 3
## $ Q62a2   <fct> 2, 2, 2, 2, 2, 3
## $ Q62a3   <fct> 3, 3, 3, 3, 2, 2
## $ Q62a4   <fct> 2, 1, 2, 2, 3, 2
## $ Q62a5   <fct> 1, 2, 2, 2, 2, 2
## $ Q62b1   <fct> 2, 1, 2, 2, 2, 1
## $ Q62b2   <fct> 2, 1, 3, 1, 1, 2
## $ Q62b3   <fct> 2, 2, 2, 1, 2, 2
## $ Q62b4   <fct> 2, 2, 2, 2, 1, 1
## $ Q62b5   <fct> 2, 2, 3, 2, 1, 1
## $ Q62c    <fct> 3, 1, 4, 3, 3, 1
## $ Q63a1   <fct> 3, 3, 1, 2, 3, 3
## $ Q63b1   <fct> 2, 3, 1, 3, 2, 3
## $ Q63c1   <fct> 2, 2, 2, 3, 3, 3
## $ Q63a2   <fct> 2, 2, 2, 3, 3, 3
## $ Q63b2   <fct> 2, 3, 2, 2, 3, 3
## $ Q63c2   <fct> 2, 3, 2, 3, 2, 3
## $ Q63a3   <fct> 3, 3, 1, 1, 2, 3
## $ Q63b3   <fct> 2, 3, 2, 2, 1, 3
## $ Q63c3   <fct> 2, 3, 2, 2, 2, 3
## $ Q63a4   <fct> 3, 3, 1, 2, 2, 2
## $ Q63b4   <fct> 2, 3, 2, 1, 2, 2
## $ Q63c4   <fct> 2, 3, 2, 2, 1, 3
## $ Q64     <fct> 5, 3, 4, 4, 4, 3
## $ Q65     <fct> 3, NA, NA, NA, NA, NA
## $ Q66_1   <fct> 3, 3, 3, 4, 5, 3
## $ Q66_2   <fct> 2, 3, 3, 4, 4, 3
## $ Q66_3   <fct> 2, 4, 6, 4, 3, 3
## $ Q66_4   <fct> 2, 2, 6, 2, 3, 3
## $ Q66_5   <fct> 3, 3, 2, 2, 4, 3
## $ Q66_6   <fct> 3, 3, 6, 2, 5, 4
## $ Q66_7   <fct> 2, 2, 2, 2, 5, 3
## $ Q66_8   <fct> 3, 2, 6, 3, 5, 3
## $ Q66_9   <fct> 3, 3, 2, 3, 2, 3
## $ Q66_10  <fct> 3, 3, 3, 5, 2, 3
## $ Q66_11  <fct> 3, 4, 3, 6, 3, 2
## $ Q66_12  <fct> 4, 4, 6, 6, 3, 4
## $ Q66_13  <fct> 2, 2, 6, 6, 3, 2
## $ Q66a    <fct> 1, 13, 1, 1, 4, 1
## $ Q66b    <fct> 2, 8, 2, 4, 7, 6
## $ Q66c    <fct> 4, 4, 7, 6, 9, 13
## $ Q67a_1  <fct> 2, 1, 1, 1, 2, 1
## $ Q67a_2  <fct> 6, 3, 2, 8, 8, 4
## $ Q67a_3  <fct> 5, 7, 6, 5, 4, 5
## $ Q67b_1  <fct> 4, 4, 4, 7, 6, 3
## $ Q67b_2  <fct> 1, 5, 5, 6, 1, 6
## $ Q67b_3  <fct> 7, 6, 7, 3, 7, 7
## $ Q67c_1  <fct> 4, 7, 4, 4, 7, 4
## $ Q67c_2  <fct> 8, 2, 5, 5, 3, 2
## $ Q67c_3  <fct> 6, 5, 7, 2, 2, 8
## $ Q68a_1  <fct> 1, 3, 11, 2, 1, 3
## $ Q68a_2  <fct> 3, 2, 12, 10, 9, 2
## $ Q68a_3  <fct> 5, 5, 8, 5, 5, 1
## $ Q68a_4  <fct> 6, 1, 5, 1, 10, 5
## $ Q68a_5  <fct> 11, 10, 16, 8, 11, 4
## $ Q68b_1  <fct> 13, 7, 7, 13, 8, 7
## $ Q68b_2  <fct> 14, 8, 9, 4, 2, 8
## $ Q68b_3  <fct> 15, 9, 4, 9, 12, 9
## $ Q68b_4  <fct> 16, 16, 13, 7, 3, 10
## $ Q68b_5  <fct> 4, 12, 14, 3, 7, 16
## $ Q68c_1  <fct> 8, 5, 7, 16, 4, 5
## $ Q68c_2  <fct> 9, 9, 13, 6, 13, 13
## $ Q68c_3  <fct> 7, 13, 14, 12, 6, 15
## $ Q68c_4  <fct> 13, 6, 4, 15, 14, 14
## $ Q68c_5  <fct> 16, 15, 3, 8, 7, 11
## $ Q69a_1  <fct> 3, 4, 3, 5, 5, 4
## $ Q69a_2  <fct> 2, 2, 3, 3, 4, 3
## $ Q69a_3  <fct> 2, 2, 2, 3, 3, 3
## $ Q69a_4  <fct> 4, 3, 3, 2, 3, 3
## $ Q69a_5  <fct> 3, 3, 4, 3, 3, 2
## $ Q69a_6  <fct> 2, 4, 3, 6, 5, 2
## $ Q69a_7  <fct> 2, 4, 3, 5, 5, 3
## $ Q69a_8  <fct> 1, 1, 4, 5, 5, 3
## $ Q69a_9  <fct> 1, 1, 2, 5, 4, 3
## $ Q69a_10 <fct> 2, 1, 3, 4, 4, 3
## $ Q69b_1  <fct> 3, 8, 2, 2, 3, 9
## $ Q69b_2  <fct> 8, 9, 8, 6, 5, 8
## $ Q69b_3  <fct> 9, 3, 10, 8, 8, 2
## $ Q70     <fct> 2, 2, 2, 1, 1, 2
## $ Q71a_1  <fct> 1, 1, 1, 1, 1, 1
## $ Q71a_2  <fct> 1, 1, 1, 1, 2, 1
## $ Q71a_3  <fct> 2, 2, 1, 1, 2, 1
## $ Q71a_4  <fct> 1, 2, 2, 2, 2, 1
## $ Q71a_5  <fct> 1, 2, 1, 2, 1, 3
## $ Q71a_6  <fct> 1, 1, 1, 2, 1, 3
## $ Q71a_7  <fct> 1, 1, 2, 3, 2, 2
## $ Q71a_8  <fct> 1, 1, 1, 3, 1, 1
## $ Q71a_9  <fct> 1, 1, 1, 3, 3, 1
## $ Q71a_10 <fct> 1, 3, 1, 2, 1, 2
## $ Q71a_11 <fct> 1, 3, 1, 2, 1, 2
## $ Q71a_12 <fct> 1, 3, 2, 2, 3, 2
## $ Q71a_13 <fct> 2, 3, 2, 1, 2, 1
## $ Q71a_14 <fct> 1, 1, 2, 1, 1, 1
## $ Q71a_15 <fct> 1, 1, 1, 1, 1, 1
## $ Q71a_16 <fct> 1, 1, 2, 2, 2, 1
## $ Q71a_17 <fct> 1, 1, 1, 2, 3, 1
## $ Q71a_18 <fct> 1, 2, 1, 2, 3, 1
## $ Q71b_1  <fct> 2, 8, 1, 1, 3, 14
## $ Q71b_2  <fct> 15, 7, 6, 2, 8, 15
## $ Q72     <fct> 1, 1, 1, 2, 2, 2
## $ Q73a    <fct> 2, 3, 1, 6, 6, 4
## $ Q73b    <fct> 3, 4, 2, 5, 5, 3
## $ Q73c    <fct> 1, 1, 5, 7, 2, 1
## $ Q73d    <fct> 6, 2, 3, 2, 1, 2
## $ Q73e    <fct> 4, 7, 4, 1, 7, 6
## $ Q73f    <fct> 5, 6, 6, 3, 3, 7
## $ Q73g    <fct> 7, 5, 7, 4, 4, 5
## $ A74a_1  <fct> 4, 5, 3, 5, 5, 4
## $ A74a_2  <fct> 5, 5, 3, 6, 5, 4
## $ A74a_3  <fct> 5, 5, 4, 3, 3, 3
## $ A74a_4  <fct> 5, 5, 3, 2, 3, 3
## $ A74a_5  <fct> 5, 5, 2, 2, 4, 3
## $ A74a_6  <fct> 5, 5, 3, 4, 5, 4
## $ A74a_7  <fct> 5, 5, 3, 5, 4, 4
## $ A74a_8  <fct> 5, 5, 4, 4, 3, 4
## $ A74a_9  <fct> 5, 5, 4, 4, 5, 4
## $ A74a_10 <fct> 5, 5, 3, 4, 5, 4
## $ A74a_11 <fct> 5, 5, 3, 3, 3, 3
## $ A74a_12 <fct> 5, 5, 2, 3, 3, 4
## $ A74a_13 <fct> 5, 5, 3, 3, 4, 3
## $ A74a_14 <fct> 3, 4, 3, 4, 6, 4
## $ A74a_15 <fct> 3, 4, 3, 4, 4, 4
## $ A74a_16 <fct> 5, 4, 4, 6, 3, 3
## $ A74a_17 <fct> 5, 3, 3, 5, 4, 3
## $ A74a_18 <fct> 4, 3, 3, 3, 4, 3
## $ A74a_19 <fct> 2, 3, 3, 3, 6, 4
## $ A74a_20 <fct> 2, 2, 3, 3, 6, 4
df01 <- df%>%
  select(Q3,Q4,Q7,Q8a,Q8b,Q8c,Q8d,Q8e,Q9,Q10,Q11)
head(df01)
##                                         Q3  Q4 Q7 Q8a Q8b Q8c Q8d Q8e      Q9
## 1              B<U+1EA1>ch Minh H<U+1EA3>i 202  1   1   2   2   2   3      NA
## 2                     Ðào Ð<U+1EE9>c Hoàng 202  1   2   3   2   2   3 2500000
## 3             nguy<U+1EC5>n van t<U+1ED1>t  67  1   1   3   1   1   1      NA
## 4                    lê minh tru<U+1EDD>ng  67  1   1   2   1   2   1      NA
## 5 nguy<U+1EC5>n th<U+1ECB> thu th<U+1EA3>o  67  1   2   2   1   2   1 1800000
## 6   Nguy<U+1EC5>n Tr<U+1ECD>ng Tu<U+1EA5>n 202  1   1   3   1   1   1      NA
##   Q10  Q11
## 1  25  202
## 2   7  298
## 3  62 <NA>
## 4  75 <NA>
## 5   1   73
## 6  40 <NA>
summary(df01)
##       Q3                 Q4            Q7        Q8a       Q8b      Q8c      
##  Length:20000       Length:20000       1:18647   1:17154   1:1614   1:17519  
##  Class :character   Class :character   2: 1353   2: 2779   2:9894   2: 2444  
##  Mode  :character   Mode  :character             3:   41   3:6720   3:   37  
##                                                  4:   26   4:1772            
##                                                                              
##                                                                              
##                                                                              
##  Q8d       Q8e             Q9                Q10            Q11           
##  1:13249   1:13937   Min.   :       0   Min.   : 0.00   Length:20000      
##  2: 6679   2:  510   1st Qu.:       0   1st Qu.:10.00   Class :character  
##  3:   72   3: 5553   Median : 1300000   Median :36.00   Mode  :character  
##                      Mean   : 1722172   Mean   :33.03                     
##                      3rd Qu.: 2500000   3rd Qu.:50.00                     
##                      Max.   :65000000   Max.   :98.00                     
##                      NA's   :16140      NA's   :45
table(df01$Q8a) # Cách tính thứ 1 sử dụng trực tiếp hàm table trong R
## 
##     1     2     3     4 
## 17154  2779    41    26
df01 %>%
count("Q8a")   # cách tính thứ 2 sử dụng dplyr với count
##   Q8a  freq
## 1   1 17154
## 2   2  2779
## 3   3    41
## 4   4    26
count(df01, "Q8a")
##   Q8a  freq
## 1   1 17154
## 2   2  2779
## 3   3    41
## 4   4    26

Vẽ đồ thị thanh

ggplot(df01 %>%
         count("Q8a"), aes(x=Q8a, y=freq))+
  geom_bar(stat="identity") 

Trang điểm thêm cho đồ thị

df01 %>%
  count("Q8a") %>%
  ggplot(aes(x=Q8a, y=freq))+ #khai bao trục hoành x và trục tung
  geom_bar(stat="identity", fill="red", alpha =0.5) + # khai báo biểu đồ dạng barchart, loại biểu đồ frequenty, tô đỏ và làm mờ vùng tô đỏ
  labs(title ="Trình trạng nhà ở", # khai báo tên của biểu đồ
       subtitle = "Chủ sở hữu", # khai báo tên phụ của biểu đồ
       x = "Loại chủ sở hữu", # khai báo tên trục hoành
       y = "Số lượng") # khai báo tên trục tung

df01 %>%
  count("Q8a") %>%
  ggplot(aes(x=as.factor(Q8a), y=freq))+ # cách vẽ thứ 2 trong đó biến các giá trị 1, 2, 3, 4 thành dạng factor (category) thay vì là số, vì bản chất giá trị này không phải là số.
  geom_bar(stat="identity", fill="red", alpha =0.5) +
  labs(title ="Trình trạng nhà ở",
       subtitle = "Chủ sở hữu",
       x = "Loại chủ sở hữu",
       y = "Số lượng")+
  scale_x_discrete(labels = xticks) + # điền tên các giá trị tương ứng ở trục hoành
  geom_text(aes(label=freq), position=position_dodge(width=0.9), vjust=-0.25, color ="blue") # thêm trên đầu mỗi thanh các giá trị tương ứng với nhóm

tyle <- 1000000
df01%>%
  filter(!is.na(Q9), Q9 != 0, Q9 <10000000)%>%
  select(Q9)%>%
  ggplot(aes(x=Q9/tyle))+
  geom_density()+
  geom_histogram(aes(y = ..density..),colour = 1, fill = "white", alpha=0.2)

Vẽ đồ thị động

tyle <- 1000000
p<-df01%>%
  filter(!is.na(Q9), Q9 != 0, Q9 <10000000)%>%
  select(Q9)%>%
  ggplot(aes(x=Q9/tyle))+
  geom_density()+
  geom_histogram(aes(y = ..density..),colour = 1, fill = "white", alpha=0.2)
library(plotly)

ggplotly(p)